智能论文笔记

Handling and extracting key entities from customer conversations using Speech recognition and Named Entity recognition

Sharvi Endait , Ruturaj Ghatage , Prof. DD Kadam

分类：自然语言处理 | 机器学习

2022-11-28

In this modern era of technology with e-commerce developing at a rapid pace, it is very important to understand customer requirements and details from a business conversation. It is very crucial for customer retention and satisfaction. Extracting key insights from these conversations is very important when it comes to developing their product or solving their issue. Understanding customer feedback, responses, and important details of the product are essential and it would be done using Named entity recognition (NER). For extracting the entities we would be converting the conversations to text using the optimal speech-to-text model. The model would be a two-stage network in which the conversation is converted to text. Then, suitable entities are extracted using robust techniques using a NER BERT transformer model. This will aid in the enrichment of customer experience when there is an issue which is faced by them. If a customer faces a problem he will call and register his complaint. The model will then extract the key features from this conversation which will be necessary to look into the problem. These features would include details like the order number, and the exact problem. All these would be extracted directly from the conversation and this would reduce the effort of going through the conversation again.

translated by 谷歌翻译

D&D: Learning Human Dynamics from Dynamic Camera

Jiefeng Li , Siyuan Bian , Chao Xu , Gang Liu , Gang Yu , Cewu Lu

分类：计算机视觉 | 机器学习

2022-09-19

从单眼视频中进行的3D人姿势估计最近看到了显着改善。但是，大多数最先进的方法都是基于运动学的，它容易出现具有明显伪影的物理上不可信的运动。当前基于动态的方法可以预测物理上合理的运动，但仅限于具有静态相机视图的简单场景。在这项工作中，我们介绍了D＆D（从动态相机中学习人类动力学），该法律利用物理定律使用移动的摄像机从野外视频中重建3D人类运动。 D＆D引入了惯性力控制（IFC），以考虑动态摄像机的惯性力来解释非惯性局部框架中的3D人运动。为了学习有限注释的接地接触，我们开发了概率接触扭矩（PCT），该概率是通过与接触概率的可区分抽样计算的，并用于生成运动。接触状态可以通过鼓励模型产生正确的动作来弱监督。此外，我们提出了一个细心的PD控制器，该控制器使用时间信息来调整目标姿势状态，以获得平稳而准确的姿势控制。我们的方法完全是基于神经的，并且在物理引擎中没有离线优化或模拟的情况下运行。大规模3D人体运动基准的实验证明了D＆D的有效性，在该基于最新的运动学基于动力学和基于动力学的方法的情况下，我们表现出卓越的性能。代码可从https://github.com/jeffsjtu/dnd获得

translated by 谷歌翻译

Biblio-Analysis of Cohort Intelligence (CI) Algorithm and its allied applications from Scopus and Web of Science Perspective

Ishaan Kale , Rahul Joshi , Kalyani Kadam

分类：人工智能

2022-09-07

队列智能或CI是这种新型优化算法之一。自成立以来，在很短的范围内成功地应用于各个领域，并且观察到与同类算法相比，其结果是有效的。到目前为止，在CI及其相关应用程序上还没有进行过这种类型的文献计量分析。因此，对于那些希望将CI提升到新水平的人来说，这篇研究论文将是破冰船。在这篇研究论文中，Scopus中可用的CI出版物通过图表，有关作者，源标题，关键字的网络图进行分析，这些年来，期刊和期刊。在某种程度上，该文献计量学论文以其文献计量详细信息来展示CI，其应用和详细的系统审查。

translated by 谷歌翻译

Generative Transfer Learning: Covid-19 Classification with a few Chest X-ray Images

Suvarna Kadam , Vinay G. Vaidya

分类：计算机视觉 | 机器学习

2022-08-10

通过医学成像检测疾病是由于其非侵入性的。医学成像支持多种数据模式，可以在人体内部进行彻底快速的外观。但是，解释成像数据通常是耗时的，需要大量的人类专业知识。深度学习模型可以加快解释并减轻人类专家的工作。但是，这些模型是数据密集型的，需要大量标记的图像进行培训。在新型疾病暴发（例如Covid-19）中，我们通常没有所需的标记成像数据，尤其是在流行病开始时。深度转移学习通过在公共领域中使用验证的模型来解决此问题，例如任何VGGNET，RESNET，INCEPTION，DENSENET等的变体都是功能学习者，以快速从较少的样本中适应目标任务。大多数审慎的模型都是深层建筑的深度。他们接受了大型多级数据集（例如ImageNet）的培训，并在建筑设计和超级参数调整方面进行了重大努力。我们提出了1个更简单的生成源模型，在单个但相关的概念上预估计，可以与现有较大的预审预周化模型一样有效。我们证明了生成转移学习的有用性，该学习需要较少的计算和培训数据，对于少数射击学习（FSL），使用COVID-19-19，二进制分类用例。我们将经典的深度转移学习与我们的方法进行了比较，还报告了FSL结果，三个设置为84、20和10个培训样本。用于COVID-19分类的生成FSL的模型实现可在https://github.com/suvarnak/generativefslcovid.git上公开获得。

translated by 谷歌翻译

Plot Writing From Pre-Trained Language Models

Yiping Jin , Vishakha Kadam , Dittaya Wanvarie

分类：自然语言处理

2022-06-07

预训练的语言模型（PLM）无法生成长形式的叙事文本，因为它们不考虑全局结构。结果，生成的文本通常是不巧妙的，重复的或缺乏内容的。故事发电的最新工作以提示，关键字或语义框架的形式重新引入了明确的内容计划。经过大型平行语料库的培训，这些模型可以生成更合乎逻辑的事件序列，从而产生更满足的故事。但是，这些中间表示通常不使用自然语言，并且不需要微调就无法使用。我们建议使用现成的PLM生成故事情节，同时保持内容计划的好处，以产生凝聚力和满足的故事。我们提出的方法ScratchPlot首先提示PLM构成内容计划。然后，我们生成故事的身体并以内容计划结束。此外，我们通过使用其他PLM来对生成的（故事，结尾）对进行排名。我们用各种基线基准测试我们的方法，并在人类和自动评估中取得了卓越的结果。

translated by 谷歌翻译

Controlled Generation of Unseen Faults for Partial and Open-Partial Domain Adaptation

Katharina Rombach , Dr. Gabriel Michau , Prof. Dr. Olga Fink

分类：机器学习

2022-04-29

由于培训和测试数据分布之间的域移动，新的操作条件可能会导致故障诊断模型的大量性能下降。尽管已经提出了几种域的适应方法来克服此类域移位，但如果两个域中表示的故障类别不相同，则其应用是有限的。为了在两个不同的域之间启用训练有素的模型的更好可传递性，尤其是在两个域之间仅共享健康数据类别的设置中，我们提出了一个新的框架，以基于生成不同的故障签名的部分和开放式域适应一个瓦斯林甘。提出的框架的主要贡献是具有两个主要不同特征的受控合成断层数据生成。首先，所提出的方法使目标域中仅能访问目标域中的健康样品和源域中的样本错误，从而在目标域中生成未观察到的故障类型。其次，可以将故障产生控制以精确生成不同的故障类型和故障严重程度。所提出的方法特别适合于极端域的适应设置，这些设置在复杂和安全关键系统的背景下特别相关，其中两个域之间仅共享一个类。我们在两个轴承断层诊断案例研究上评估了部分和开放式域适应任务的拟议框架。我们在不同标签空间设置中进行的实验展示了提出的框架的多功能性。与给定较大域间隙的其他方法相比，提出的方法提供了优越的结果。

translated by 谷歌翻译

Proxying ROS communications -- enabling containerized ROS deployments in distributed multi-host environments

Arne Wendt , Prof. Dr. -Ing. Thorsten Schüppstuhl

分类：机器人

2022-01-05

随着在边缘处使用容器的能力，它们构成了统一的解决方案，以打击分布式多主机ROS部署的复杂性，以及各个ROS节点和依赖关系部署。ROS中的双向通信对使用包含多个机器的非容集装箱中的集装箱ROS部署构成了挑战。我们将分析ROS采用的通信协议，以及不同容器网络模式的适用性及其对ROS部署的影响。最后，我们将为ROS呈现第7层透明代理服务器架构，作为所识别的问题的解决方案。不仅可以在集装箱中的环境中使用ROS，但通常在网段之间代理ROS。

translated by 谷歌翻译

A Solution to the Generalized ROS Hardware IO Problem -- A Generic Modbus/TCP Device Driver for PLCs, Sensors and Actuators

Arne Wendt , Prof. Dr. -Ing. Thorsten Schüppstuhl

分类：机器人

2021-12-21

机器人操作系统（ROS）提供软件框架，知识和社区生态系统提供资源，以便快速开发和原型智能机器人应用。通过标准化软件模块的通信，配置和调用，ROS便于重用设备驱动程序和算法实现。使用现有的功能实现允许用户从测试和已知的功能中组装其机器人应用程序。尽管ROS-Industrial Consortium和Rosin这样的项目努力将ROS带到工业应用和整合工业硬件，但我们观察缺乏在普遍整合基本物理IO的选择。在这项工作中，我们通过为ROS实现通用Modbus / TCP设备驱动程序来安置并提供解决此问题。

translated by 谷歌翻译

Improving Performance of Federated Learning based Medical Image Analysis in Non-IID Settings using Image Augmentation

Alper Emin Cetinkaya , Dr. Murat Akin , Prof. Dr. Seref Sagiroglu

分类：人工智能 | 计算机视觉

2021-12-12

联邦学习（FL）是利用属于患者，人，公司或行业的敏感数据的合适解决方案，这些数据在刚性隐私约束下工作的难题。 FL主要或部分地支持数据隐私和安全问题，并提供促进促进多个边缘设备或组织的模型问题的替代方案，以使用许多本地数据培训全局模型而不具有它们。由其分布式自然引起的FL的非IID数据具有显着的性能下降和稳定性偏斜。本文介绍了一种新颖的方法，通过增强图像动态平衡客户端的数据分布，以解决FL的非IID数据问题。介绍的方法非常稳定模型培训，并将模型的测试精度从83.22％提高到89.43％，对于高度IID FL设定中的胸部X射线图像的多胸疾病检测。 IID，非IID和非IID的结果，联合培训表明，该方法可能有助于鼓励组织或研究人员开发更好的系统，以获得与数据隐私的数据的价值不仅适用于医疗保健，而且领域。

translated by 谷歌翻译

GPCO: An Unsupervised Green Point Cloud Odometry Method

Pranav Kadam , Min Zhang , Shan Liu , C. -C. Jay Kuo

分类：计算机视觉

2021-12-08

视觉径图旨在使用视觉传感器捕获的信息跟踪对象的增量运动。在这项工作中，我们研究了点云测量问题，其中仅使用LIDAR（光检测和测距）获得的点云扫描来估计对象的运动轨迹。提出了一种轻量点云测距溶液，并命名为绿点云机径（GPCO）方法。 GPCO是一种无监督的学习方法，可以通过匹配连续点云扫描的特征来预测对象运动。它由三个步骤组成。首先，使用几何特征感知点采样方案来选择来自大点云的判别点。其次，视图被划分为围绕对象的四个区域，并且尖端++方法用于提取点特征。第三，建立点对应，以估计两个连续扫描之间的对象运动。进行了基准数据集的实验，以证明GPCO方法的有效性。据观察，GPCO以准确性的准确性越优于深度学习方法，而模型规模明显较小，培训时间较少。

translated by 谷歌翻译